Sumário

1. Introdução
2. Definição do grupo de dados
3. Definição do método de agrupamento e critério de dissimilaridade 4. Definição da quantidade de Grupos
5. Conclusão

   

## Warning in function_list[[k]](value): NAs introduzidos por coerção

## Warning in function_list[[k]](value): NAs introduzidos por coerção

## Warning in function_list[[k]](value): NAs introduzidos por coerção

1. Introdução

Felipe ja escreveu

   

2. Definição do grupo de dados

Buscando selecionar um grupo de cartas com estruturas semelhantes e variáveis numéricas para que possamos realizar a análise de agrupamentos, utilizaremos neste estudo somente as cartas do tipo “Criatura”. Cada uma delas representa um personagem no universo do jogo e possuem as características abaixo:

Variável Descrição
Power Força de Ataque
Toughness Força de Defesa
Mana Cost Custo de Utilização

O objetivo do agrupamento será classificar as cartas em categorias onde as criaturas se assemelhem em suas aplicações estratégias do jogo. A quantidade e definição dos grupos não está pré definida.

     

De um total de 8370 criaturas disponíveis na base de dados, foi relizado um tratamento para que houvesse somente um elemento com cada combinação única das três variáveis. Após o tratamento, o arquivo utilizado para o estudo tinha disponível 380 elementos., uma quantidade grande o suficiente para prosseguirmos com as análises.

Visualização das observações:

 

MAtriz de Correlação:

 

Podemos observar também que existe uma correlação média entre as variáveis. Segundo Hair (pg 446), a medida de distancia de Mahalanobis é mais adequada quando as variáveis são altamente correlacionadas, seguiremos, portanto, utilizando a medida de distância Euclidiana.

   

3. Definição do método de agrupamento e critério de dissimilaridade

 

Neste estudo, a similaridade entre as observações será medida de acordo com a distância euclidiana em cada par de observações, com base nas variáveis Power, Tougness e Cost, no espaço tridimencional, onde as distancias menores vão representar maior similaridade.

Como não está pré-definida a quantidade de grupos, realizaremos uma comparação entre métodos hierárquicos Ward, UPGMA, WPGMA, WPGMC, e UPGMC.

 

A visualização hierárquica dos métodos pode ser visualizada na figura abaixo  

 

Observando a curvatura do gráfico de cotovelo e a distribuição observações na hierarquia dos diferentes métodos, vamos criar 5 clusters utilizando o método de Ward.

 

## grupos.ward
##   1   2   3   4   5 
##  92  68 123  49  15

Visualização dos Grupos no espaço tridimensional:

   

 

Visualizando as características de cada grupo individualmente:    

Observando as características dos grupos, podemos descreve-los

   

5. Conclusão